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С 青岛 市 晨星 实验 学 校 ， 青 岛 266000) 
摘 要 早 发 现 、 早 诊断 、 早 干预 是 开展 自 闭 症 儿童 教育 康复 工作 的 共识 ,但 传统 识别 和 诊断 
方法 局 限 及 专业 人 员 缺 乏 常 导 致 自 周 症 儿 童 错失 最 佳 干 预期 。 为 改善 现状 , 近年 来 机 器 学 习 
凭借 其 客观 准确 、 简 便 灵 活 等 方面 的 优势 ， 逐 渐 被 应 用 到 自 闭 症 的 早期 预测 、 筛 查 、 诊 断 和 
HP, 积累 了 较为 丰富 的 成 果 。 但 是 机 器 学 习 也 在 研究 对 象 选取 、 分 类 数据 采集 
和 理论 模型 应 用 等 方面 存在 局 限 性 .未 来 研究 应 推动 构建 孚 产 期 和 新 生 儿 病理 生理 信息 追踪 
数据 库 和 标准 化 模型 分 类 指标 体系 , 同时 继续 优化 算法 , 加 快 智能 化 自 闭 症 识 别 和 诊断 理论 
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成 果 向 实践 转化 。 

关键 词 机 器 学 习 ， 自 闭 症 ， 早 期 识别 与 诊断 ， 系 统 综述 
分 类 号 

1 引言 


随 着 智能 时 代 的 到 来 ， 人工 智能 (Artificial Intelligence,AD 与 特殊 教育 的 深度 融合 已 经 成 
为 教育 发 展 的 重要 趋势 ( 郭 利 明 等 , 2019)。 众 多 研究 者 致力 于 将 人 工 智 能 技术 与 不 同类 型 、 
不 同 障碍 程度 特殊 教育 需要 儿童 的 需求 相 匹 配 ， 为 他 们 提供 更 具 个 性 化 、 精 准 化 的 教育 康复 
与 医疗 诊治 服务 ， 进 一 步 改善 其 生活 和 学 习 质 量 。 随 着 技术 的 不 断 成 熟 ， 自 闭 症 谱系 障碍 
(Autism Spectrum Disorders, ASD) 这 一 数量 庞大 、 病 因 复 杂 群 体 受到 了 智能 教育 界 的 广泛 关 
a 注 , 围绕 为 自 闭 症 实 施行 之 有 效 的 干预 这 一 焦点 问题 展开 了 一 系列 的 探讨 , 其 中 科学 准确 的 
早期 识别 和 诊断 作为 教育 干预 开展 的 前 提 , 不 可 避免 地 成 为 了 研究 与 实践 中 必须 面 对 和 吸 竺 
解决 的 关键 问题 。 

根据 美国 疾病 预防 和 控制 中 心 数据 显示 ，2021 年 自 闭 症 谱系 障碍 的 发 病 率 为 1/44， 与 
2000~2002 年 的 1/150 相 比 ， 患 病 率 增 加 了 近 240.9%。 面 对 不 断 攀 升 的 患 病 率 和 尚 不 明确 
的 发 病 机 制 ， 自 闭 症 已 演变 成 为 全 球 性 重大 公共 卫生 问题 。 积极 开 展 早期 预防 、 识 别 和 干预 
是 应 对 这 一 挑战 的 重要 举措 。 然 而 目前 很 少 有 专门 面向 ASD 群体 的 大 范围 患 病 风 险 得 查 ， 
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ASD 诊断 也 主要 依靠 外 在 的 行为 观察 与 评估 人 员 的 主观 经 验 判断 。 和 常规 诊断 流程 是 评估 人 


员 依 据 标 准 化 诊断 工具 (如 Diagnostic and Statistical Manual of Mental Disorders-4/5th ed, DSM- 


IV/DSM-V; International Classification of Diseases, ICD) 对 儿童 进行 评定 ， 评 定 方 式 包括 心理 
和 教育 测量 、 医 学 检查 、 家 长 或 监护 人 访谈 、 日 常 观察 等 ， 操 作 费 时 ， 对 于 评估 人 员 具 有 极 
高 的 专业 理论 知识 和 临床 经 验 要 求 。 但 现实 情况 是 ， 国 内 具备 诊断 资质 的 专业 人 员 非 常 少 ， 
即使 是 在 特殊 教育 发 展 相对 靠 前 的 一 些 国 家 ， 如 美国 ， 能 够 进行 ASD 诊断 的 儿科 医生 也 仅 
占 全 体 医 生 8% 的 比例 ( 陈 顺 森 等 ,2011)， 专业 诊 断 “ 一 号 难 求 ” 有 研究 显示 ,尽管 自 闭 症 儿 
童 的 行为 症状 早 在 1 一 2 岁 就 能 表现 出 来 ， 但 典型 自 闭 症 诊断 的 平均 年 龄 却 在 4 岁 以 后 ， 轻 
度 自 闭 症 的 诊断 年 龄 在 5.6~8.6 岁 (Sheldrick et al., 2017)， 高 功能 自 闭 症 甚 至 要 延迟 到 11 岁 
以 后 (Guinchat et al.,2012)， 儿 童 被 迫 陷入 “等 待 失 败 ” 的 痛苦 中 。 男 外 这 种 完全 基于 外 在 行 
为 的 、 主 观 的 诊断 纳入 的 参考 变量 有 限 , 缺乏 客观 一 致 的 神经 科学 指标 ， 误诊、 漏诊 时 有 发 
生 (Klin et al., 2000)， 一 部 分 儿童 被 错误 地 贴 上 了 自 闭 症 的 标签 ， 严 重 违背 了 评估 诊断 的 初 
训 。 最 令 人 担忧 的 是 ,这 些 问 题 会 严重 阻碍 自 闭 症 患者 早期 干预 ,延误 教育 康复 的 黄金 时 段 ， 
给 自 闭 症 儿童 及 其 家 庭 带 来 巨大 的 心理 和 经 济 负担 。 最后， 即使 自 闭 症 儿 童 诊断 完成 ， 后 续 
基于 这 些 患者 表现 进行 的 病因 、 症 状 研 究 仍 属于 回溯 性 分 析 ， 很 难 全 面 客观 地 总 结 ASD 行 
为 特征 ， 提 取 可 表征 潜在 生理 机 制 的 标记 物 ， 筛 选 出 和 临床 预测 相关 度 比较 高 的 特征 。 这 使 
得 我 们 在 自 闭 症 儿童 防治 工作 中 一 直 处 在 被 动 状态 。 

机 器 学 习 (Machine Learning, ML) 作 为 人 工 智 能 的 核心 , 是 一 类 从 数据 中 自动 分 析 获 得 规 
律 ， 并 利用 规律 对 未 知 数据 进行 预测 的 技术 ( 余 明 华 等 , 2017)。 该 技术 自动 生成 的 规则 不 受 
Pr 个 体 主 观 经 验 的 影响 ， 对 于 提升 分 类 的 特异 性 、 敏 感性 、 准 确 性 和 增加 分 类 效率 都 具有 重要 

意义 。 此 外 ， 机 器 学 习 可 以 提取 大 量 数据 中 细微 的 、 潜 在 有 用 的 信息 ， 并 利用 这 些 信 息 创 建 
一 个 针对 当前 问题 的 预测 或 分 类 模型 , 特别 适用 于 洞察 复杂 问题 的 内 在 规律 , 帮助 尽早 发 现 
可 能 病因 ( 李 航 , 2012; 崔 建 伟 等 , 2021)。 国 内 外 学 者 将 其 应 用 于 多 种 精神 与 神经 系统 疾病 的 
分 类 、 诊 断 、 治 疗 和 预后 管理 中 ， 在 自 闭 症 群体 的 预测 、 识 别 和 辅助 诊断 实证 研究 中 也 取得 
了 大 量 有 价值 的 成 果 , 但 国内 在 该 方面 的 研究 报告 相对 较 少 。 本文 就 机 器 学 习 在 自 闭 症 儿童 
早期 识别 和 诊断 中 的 应 用 进行 综述 ， 以 期 为 国内 相关 研究 与 实践 提供 参考 。 
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2 研究 方法 


采用 国际 上 广泛 使 用 的 系统 性 文献 综述 和 元 分 析 方 法 (Preferred Reporting Items for 


Systematic reviews and Meta-Analyses, PRISMA) 来 确定 纳入 研究 的 论文 构成 。 该 方法 包括 4 


个 文献 筛选 阶段 


， 共 计 27 


条 综述 项 目 


目 包括 文献 标题 


、 摘 要 、 研 究 
发 展 迅猛 , 更 新 换代 速度 极 快 ,本文 选取 近 五 和 旬 
域 文献 , 具体 检索 日 期 范围 为 2016 年 1 月 1 日 ~2021 年 4 月 29 H.M) 


也 | 


j 的 英文 主题 词 


。4 个 阶段 分 别 为 检索 、 初 夭 、 纳 入 和 综合 ， 综 述 项 
目的 、 研 究 方法 和 研究 结果 等 。 考 虑 到 近年 来 计算 机 科学 技术 
E 来 机 器 学 习 在 自 闭 症 儿童 早期 识别 和 诊 


断 领 
A: 


“Autis” “Prediction” “Early Screening/ Early Detection/ Early Identification/ Early Recognition” 


“Early Diagnosis” “Machine Learning/ Artificial Intelligence”, 在 EBSCO, Elsevier Science Direct, 


SAGE, Web of Science. Springer 五 个 


议 (Peer-reviewed) 期 1 


570 篇 。 作 者 


获取 纳入 综述 的 文献 60 篇 ( 见 图 1). 
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文献 纳入 标准 : (1) 文 献 为 英文 实 订 
象 中 至 少 包含 1 名 ASD 儿童 (在 本 文 ! 


a 18 岁 以 下 的 个 体 )， 且 具有 明确 的 被 试 统计 学 变量 (年 龄 或 “儿童 ”标注 !; (3) 研 究 包含 明 


Fi], 387% 520 篇 文献 ， 通 


< 同 阅读 文献 的 标题 、 
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昌 库 检索 相关 文献 


其 他 资源 途径 (引文 第 
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综合 性 外 文 数据 库 进行 检索 ， 限 定 检 索 范 围 为 同行 评 
过 参考 文献 引文 检索 又 获得 50 篇 文献 ， 
摘要 及 正文 ， 删 除 重复 、 不 符合 既定 标准 的 论文 ， 


共计 


最 后 


| 


最 终 纳 入 文献 (N=60) 


图 1 PRISMA 文献 筛选 流程 图 


(N=520) 选 ) 获 取 文 献 (N=50) 
相关 文献 总 数 (N=570) —>| Sil RZ SCR(N=158) 
| 非 英 文 实 证 文献 (N=225) 
初 第 获取 文献 (N=412) — 
无 关 文献 (研究 对 象 非 儿 童 ， 与 
ASD 早期 分 类 无 关 ， 
未 采用 机 器 学 习 技 术 )(N=108) 
机 器 学 习 应 用 于 自 闭 症 早期 识别 和 诊断 文献 (N=79) 一 > 研究 模糊 文献 


(如 结论 无 明确 数据 支撑 )(N=19) 


E 期 刊 论文 ， 全 文 可 得 


1 作者 注 : 10 项 研究 中 被 试 人 数 多 、 自 


， 对 儿童 的 界定 参照 


中 部 分 被 试 年 龄 大 于 18 岁 。 


F 龄 跨度 大 ， 同 时 存在 儿童 与 成 


F 被 试 ，7 


文章 不 少 于 3 页 ; 2) 研究 对 
国际 《儿童 权利 公约 》 即 儿童 


法 做 严格 区 分 。 所 以 附 表 


确 的 研究 问题 、 方 法 和 结论 ， 研 究 结论 有 详实 的 数据 支撑 ，(4) 研 究 主题 聚焦 ASD 儿童 的 早 
期 识别 或 诊断 , 在 摘要 或 关键 词 中 明确 表明 采用 机 器 学 习 技术 进行 分 类 。 排除 标准 : (1) 非 英 
文 文献 (韩语 、 德 语 、 西 班 牙 语 等 )、 综 述 、 书 籍 章节 、 会 议 记 录 和 专利 等 文章 ， 以 及 少 于 3 
页 的 文章 ，(2) 研 究 对 象 全 部 为 18 岁 以 上 的 成 年 人 、 老 年 人 或 其 他 特殊 群体 ，(3) 研 究 问题 、 
究 设 计 或 研究 结论 模糊 不 清 ， 结 论 没有 数据 支撑 ; (4) 与 ASD 无 关 的 精神 疾病 研究 以 及 
未 应 用 机 器 学 习 方 法 的 研究 。 这 些 标准 是 在 文献 搜索 之 前 确定 的 ,以 减少 在 文献 筛 查 期 间 的 
潜在 偏见 。 

最 后 ， 基 于 徐 建 平和 张 厚 祭 (2005) 提 出 的 “ 归 类 一 致 性 公式 ”检测 编码 信 度 ， 由 前 两 位 
作者 共同 计算 出 纳入 综合 分 析 的 文献 评分 者 信 度 在 0.50 一 1.00 之 间 ， 总 的 归 类 一 致 性 为 
0.812; 编码 信 度 系数 值 在 0.75 一 0.80 之 间 ， 总 体 编 码 信 度 系数 为 0.759， 表 明 研 究 文献 具有 
公平 到 良好 的 一 致 性 水 平 。 

3 基于 机 器 学 习 的 自 闭 症 早期 识别 和 诊断 研究 数据 类 型 与 采集 

机 器 学 习 可 以 通过 对 已 有 数据 的 抽象 ， 发 现 数据 的 隐藏 规律 ( 董 健 宇 等 , 2020)。 因 此 数 
据 是 模型 建立 的 源头 性 因素 ， 建 模 的 第 一 步 就 是 数据 收集 。 

3.1 数据 构成 

ASD 儿童 本 身 异 质 性 高 ， 数 据 结构 性 不 强 ， 因 此 分 类 模型 的 原始 数据 一 般 为 二 分 类 数 
据 。 从 被 试 构成 看 ， 研 究 者 一 般 同 时 设置 实验 组 和 对 照 组 ， 选 取 ASD 及 与 其 生理 年 龄 、 箱 


力 年 龄 等 相 匹配 的 其 他 发 展 障碍 或 典型 发 展 儿童 (typically developing, TD)， 其 中 障碍 儿童 
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- = 见 类 型 有 注意 缺陷 多 动 障 得 (Attention Deficit Hyperactivity Disorder, ADHD), ЖК 


© (Developmental Delay, DD)、 儿 童 失语 症 (Childhood Apraxia of Speech, CAS) 和 其 他 神经 发 育 


障碍 (Other neurodevelopmental disorder, OND)。 也 有 研究 根据 儿童 未 来 患 自 闭 症 风险 程度 分 
为 高 风险 (High Risk, HR) 和 低 风险 (Low Risk, LR) 组 。 从 被 试 年 龄 范围 看 ,涉及 个 体 发 展 的 各 
个 阶段 ,得 查 和 诊断 的 最 早 时 间 基 本 上 在 3 岁 以 内 ,处 于 婴儿 期 和 幼儿 期 阶段 。 自 闭 症 风险 
预测 研究 时 间 更 早 , 一 般 在 1 岁 之 前 , 也 有 研究 提前 到 孕 产 期 和 新 生 儿 时 期 , 但 这 类 研究 很 
少 。 从 被 斌 来源 看 ， 涉 及 美国 、 英 国 、 法 国 、 中 国 、 伊 朗 、 新 西 兰 、 印 度 、 意 大 利 、 韩 国 、 
西班牙 、 澳 大 利 亚 等 数 十 个 国家 和 地 区 ， 和 常见 的 数据 采集 渠道 有 自 闭 症 研究 公开 数据 库 ( 见 
表 1)、 医 院 、 特 殊 教育 学 校 或 康复 中 心 和 少量 的 在 线 搜索 引擎 (如 雅虎 问答 ,谷歌 搜索 ) 等 。 
不 同 研究 包含 的 样本 数量 差异 很 大 ,从 几 十 到 上 千 分 布 不 均 , 其 中 样本 量 超过 300 人 的 研究 
数据 基本 上 来 自 于 公开 数据 库 。 自 闭 症 研究 公开 数据 库 是 研究 者 为 帮助 不 同学 科 、 不 同 专业 


工作 者 开展 合作 研究 设置 的 开放 资源 库 , 其 储存 的 大 规模 数据 为 使 用 机 器 学 习 开 展 自 闭 症 识 
别 和 诊断 带 来 极 大 便利 。 以 使 用 频率 最 高 的 ABIDE 数据 库 为 例 ， 该 数据 库 整 合 全 球 多 个 实 
验 室 收 集 ASD 和 TD 儿童 以 脑 结构 和 功能 影像 为 主 的 研究 数据 ， 人 免费 向 科研 人 员 提 供 ， 现 
已 采集 完成 两 期 数据 , 被 试 数量 超过 2200 名 , 网 站 注册 研究 人 员 涵 盖 北 美洲 、 欧 洲 、 非 洲 、 
亚洲 等 多 个 国家 和 地 区 。 
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表 1 自 闭 症 研究 公开 数据 库 


序号 中 文 名 称 英文 名 称 (简称 ) 
1 自 闭 症 脑 成 像 数 据 交换 数据 库 Autism Brain Imaging Data Exchange (АВШЕ) 
2 自 闭 症 遗 传 资源 交换 数据 库 Autism Genetic Resource Exchange (AGRE) 
3 波士顿 自 闭 症 协会 Boston autism consortium (AC) 
4 自 闭 症 治疗 网 络 Autism Treatment Network (ATN) 
E 5 SSC 数据 库 Simons Simplex Collection (SSC) 
6 Simons VIP 数据 库 Simons Variation in Individuals Project (Simons VIP) 
7 加 州 大 学 欧文 分 校 知 识 库 University of California Irvine Repository (UCI) 


= 机 器 学 习 技术 的 运用 突破 了 传统 回溯 性 研究 的 局 限 , 自 闭 症 识别 和 诊断 的 年 龄 得 以 在 一 
S 定 程度 上 缩短 , 通过 复杂 运算 提取 的 隐藏 规律 还 可 以 被 应 用 到 孕 产 期 和 新 生 儿 检查 中 , 帮助 
及 早 发 现 高 危 因素 ， 为 早期 干预 争 得 时 间 ， 但 遗憾 的 是 目前 这 类 研究 并 不 多 见 。 除 此 之 外 ， 
机 器 学 习 技术 使 大 范围 、 多 指标 、 跨 文化 数据 收集 成 为 可 能 ， 从 独立 小 样本 数据 到 跨 地 区 的 
自 闭 症 公开 共享 数据 库 ， 有 效 提高 了 研究 的 外 部 效 度 ,也 为 更 深层 次 自 闭 症 成 因 挖掘 和 成 功 
预防 提供 依据 。 但 应 该 注意 的 是 ， 当 前 的 公开 数据 库 多 来 自 于 单位 或 个 人 研究 ， 数 据 采 集 的 
© 目的 和 标准 并 不 一 致 ， 样 本 信息 整合 缺乏 同 质 性 ,训练 集 与 测试 集 之 间 可 能 出 现 偏差， 模型 
= 的 推广 问题 还 需 进一步 验证 。 
O 3.2 数据 采集 

样本 选 定 后 就 可 以 启动 数据 采集 工作 。 近 年 来 数据 采集 方式 和 类 型 因 技 术 更 新 而 更 为 多 
样 ， 例 如 基于 脑 电信 号 和 成 像 技术 采集 生理 信号 数据 、 借 助 量 表 和 观察 、 访谈 等 收集 行为 数 
据 。 机 器 学 习 识别 和 诊断 是 基于 可 以 反映 自 闭 倾向 的 特征 及 各 种 神经 标志 物 来 进行 判断 , F 
前 主要 有 年 龄 、 性 别 、 种 族 等 人 口 统计 学 资料 ， 目 光 对 视 、 社 会 性 微笑 、 模 仿 等 典型 症状 表 
现 , 儿童 个 人 及 家 庭 病 史 等 临床 资料 ,以 及 功能 性 磁 共 振 成 像 、 结构 性 磁 共振 成 像 、 脑 电 图 、 
超声 波 等 生理 信号 数据 ( 见 表 2)， 以 及 不 同 数据 类 型 组 合 而 成 的 多 模 态 数据 。 


基于 机 器 学 习 的 自 闭 症 识别 和 诊断 研究 数据 类 型 


\ 体 指标 


功能 性 磁 共 振 成 像 (functional Magnetic Resonance Imaging, fMRI)， 结 构 性 磁 共 振 成 像 
影像 (structural Magnetic Resonance Imaging, sMRI)， 脑 电 图 (electroencephalogram, EEG)， 超 
声波 (ultrasonic, UT) 


自 闭 症 诊断 观察 量 表 (Autism Diagnostic Observation Schedule, ADOS)， 自 闭 症 诊 断 访谈 
量 表 -修订 版 (Autism Diagnostic Interview—Revised, ADI-R)， 精 神 疾 病 诊断 与 统计 手册 


(DSM-IV/ DSM-V), 国际 疾病 分 类 (1CD-10), 婴 幼 儿 自 闭 症 观察 量 表 (Autism Observational 
Scale for Infants, AOSD， 修 订 版 婴 幼 儿 自 闭 症 检 核 表 (Modified Checklist for Autism in 


适应 行为 


量 表 /问卷 Toddlers, M-CHAT)， 穆 林 早 期 学 习 量 表 (Mullen Scales of Early Learning, MSEL)， 文 兰 


量 表 (Vineland Adaptive Behavior Scales，VABS) ， 社 会 反应 量 表 (Social 


Responsiveness Scale, SRS )， 自 闭 症 谱系 量 表 (Autism-spectrum Quotient-10, AQ-10), JL 


型 行为 眼 动 行为 ， 


童 行为 检 核 表 (Child Behavior Checklist, CBCL)， 社 交 沟 通 问卷 (Social Communication 
Questionnaire, SCQ)， 家 长 问卷 ! 


社会 行为 ， 刻 板 行 为 ， 姿 势 控制 ， 上 上肢 运动 等 


眠 等 ) 


3.2.1 基于 影像 分 类 


父母 的 病史 信息 ， 儿 童 的 个 人 信息 (年 龄 、 性 别 、 惯 用 手 、 智 商 、 种 族 、 病 史 、 饮 食 、 睡 


其 他 DNA，RNA， 代 谢 物 ， 语 音 


基于 脑 成 像 、 超 声波 成 像 、 视 网 膜 成 像 等 生物 标记 作为 机 器 学 习 技术 的 输入 特征 可 以 为 


Е 闭 症 分 类 提供 客观 证 据 ? 


Lai et al., 2020). fMRI 的 


因此 在 研究 中 应 用 最 为 广泛 (Abraham et al., 2016; Caly etal., 2021; 


高 时 间 分 辩 紊 有 助 于 对 大 脑 特 定 区 域 皮层 活动 的 精准 定位 。sMRI 


空间 分 辨 率 较 高 , 能 够 客观 地 记录 不 同 个 体 相同 脑 组 织 成 分 间 的 差异 。 有 学 者 提出 自 闭 症 分 


类 研究 中 同时 采用 这 两 种 技术 效果 最 好 。 如 Rakik 等 (2020) 采 集 了 ABIDE-I 数据 库 中 817 名 


7 一 64 岁 被 试 SMRI 和 静 息 态 fMRI(resting state fMRI, rs-fMRD 影 像 ， 通 过 Fisher 算法 对 特征 


向量 (feature vectors) 降 维 ， 


降 维 后 的 特征 向 量 作为 分 类 器 的 输入 信息 ， 最 后 采用 栈 式 自 动 纺 


No 


人 码 器 和 多 层 感 知 机 算法 进行 识别 ， 准 确 率 最 高 可 达 85.06%. Sen 等 (2018) 的 研究 也 发 现 同时 
使 用 两 种 技术 作为 特征 输入 识别 ASD 和 TD 的 效果 最 佳 。 但 是 也 有 研究 显示 单独 采用 fMRI 


或 SMRI 的 影像 也 能 够 实现 自 闭 症 个 体 的 准确 识别 (Eugenia et al., 2020; Katuwal et al., 2016). 


Guo 等 (2017) 收 集 了 ASD 和 TD 的 rs-fMRI 数据 , 发现 经 过 特征 选择 的 深度 神经 网 络 分 类 准 


APS AIA 86.36%。 脑 电 造 价 较 低 、 使 用 方便 ， 可 以 为 自 闭 症 儿 童 识别 提供 脑 神经 细胞 电 生 


за 


ie 


活动 反应 证 据 。 有 研究 使 用 EEG 技术 实现 了 对 3 个 月 月 龄 (Dickinson et al., 2020) #1 3 一 14 


! 作者 注 : 在 传统 的 诊断 过 程 


H, ADOS, ADI-R, DSM-V, ICD-10 等 主要 用 于 自 闭 症 临床 诊断 ， 但 是 在 本 


研究 参考 文献 中 ， 研 究 者 也 会 ; 


竹 其 用 作 筛 查 指标 参数 ， 因 此 正文 未 做 明确 划分 。 


岁 (Grossi et al., 2017; Abdolzadegan et al., 2020) 自 闭 症 儿 童 识别 ， 表 现 良好 。 
3.2.2 基于 量 表 / 问 卷 分 类 

传统 标准 化 测量 工具 汇聚 了 临床 专家 丰富 理论 知识 和 扎实 的 实践 经 验 , 是 自 闭 症 儿童 得 
查 和 诊断 的 “ 金 标 准 ” 可 以 为 机 器 学 习 模型 构建 提供 有 力 证 据 。 基 于 传统 测验 工具 进行 识 
别 和 诊断 的 形式 有 两 种 ,第 一 种 是 将 传统 标准 化 测验 所 得 结果 借助 机 器 学 习 技术 进行 数据 分 
析 ， 探 究 分 类 准确 性 。Abbas 等 在 2018 和 2020 年 两 项 研究 中 均 将 ADOS 和 ADI-R 中 常用 
的 行为 模块 作为 分 类 器 输入 信息 , 提出 了 一 种 基于 机 器 学 习 的 多 模块 自 闭 症 评估 方法 。 该 方 
法 包含 三 个 模块 , 一 是 家 长 问卷 ,二 是 儿童 家 庭 录 像 中 标记 的 关键 行为 ， 三 是 临床 问卷 。 通 
过 随机 森林 、L2 正则 化 逻辑 回归 和 梯度 提升 决策 树 对 18 一 72 个 月 的 儿童 进行 分 类 ,发 现 当 
同时 使 用 模块 一 和 二 并 设置 不 确定 性 结果 变量 (Inconclusive Results Variant, <25%) 时 , 分 类 准 
确 率 高 于 98%， 三 模块 联合 时 准确 性 达 92%。 即 使 是 三 模块 共用 ， 测 试 总 时 长 也 仅 在 15 分 
钟 左 右 。 也 有 研究 者 基于 AQ-10( 儿 童 /青少年 /成 人 版 ) 和 幼儿 自 闭 症 量化 检 核 表 (Quantitative 


checklist for autism in Toddlers, О-СНАТ), ВИ AEF ASD Tests (Thabtah, 2019) 和 


4 


Autism AI (Shahamiri & Thabtah, 2020) 对 自 闭 症 儿童 进行 预测 ，ASD Tests 识别 准确 率 最 高 可 


达 99.85%， 时 间 仅 需 3 一 5 分 钟 。 

第 二 种 是 机 器 学 习 算 法 通过 对 传统 标准 化 量 表 或 问卷 的 项 目 删 减 , 筛选 出 最 有 具 代 表 性 的 
问题 构建 分 类 器 (Levy et al., 2017)。 如 Duda 等 (2016b) 通 过 逻辑 回归 等 算法 发 现 ， 当 从 ADI- 
R 的 93 个 条 目 中 筛选 出 7 个 关键 项 目 或 单独 选用 ADOS 第 2、3 维度 作为 分 类 依据 时 ， 对 
自 闭 症 儿童 分 类 准确 率 达 到 了 99%， 测 试 时 间 缩 短 到 十 几 分 钟 。Duda 和 Ma 等 (2016a) 以 及 


Duda 和 Haber 等 (2017) 还 以 SRS 量 表 中 的 5 种 典型 行为 和 15 个 衍生 问题 构建 分 类 器 , 分 类 


性 能 均 达 到 预期 (AUC>93%,AUC=89%)。 值 得 注意 的 是 ， 近 一 半 基 于 量 表 分 类 的 文献 是 后 
时 采用 两 种 或 两 种 以 上 工具 ， 和 希望 通过 不 同 测验 的 融合 ， 获 得 更 佳 分 类 效果 。 

3.2.3 基于 行为 分 类 

自 闭 症 儿童 典型 行为 表现 在 发 展 早期 就 可 以 直接 观测 到 , 可 以 为 分 类 模型 构建 提供 外 显 
指标 ,社交 障碍 和 重复 刻板 行为 是 ASD 诊断 的 核心 标准 , 可 作为 行为 指标 分 类 的 重要 依据 。 
Qiu 等 (2020) 采 用 静态 面孔 范式 (Still-Face Paradigm, SFP) 将 HR-ASD 和 TD 非 社会 性 /社会 性 
微笑 、 反 抗 行为 、 目 光 交 流 和 积极 社交 参与 的 频率 和 持续 时 间作 为 模型 分 类 指标 。Negin 等 
(2021) 构 建 了 HR-ASD 儿童 扩展 性 刻板 行为 数据 库 (Expanded Stereotype Behavior Dataset, 
ESBD)， 通 过 旋转 、 拍 打手 臂 、 手 部 动作 和 头 部 撞击 4 个 动作 实现 与 TD 的 区 分 。 眼 动 仪 可 
以 记录 人 在 处 理 视觉 信息 时 的 眼 动 轨迹 特征 , 眼 动 行为 是 基于 机 器 学 习 进 行 自 闭 症 分 类 的 最 


常用 行为 指标 ， 有 具体 指标 包括 注视 时 长 和 注视 频率 。Wan 等 (2019) 采 用 SMIRED250 便携 式 
眼 动 跟踪 系统 ， 记 录 4 一 6 岁 的 ASD 和 TD 在 观看 一 段 10 秒 钟 的 女性 演讲 视频 时 对 不 同 身 
体 部 位 的 注视 时 长 , 并 采用 支持 向 量 机 算法 构建 分 类 器 , 发 现 儿童 对 演讲 者 口 部 和 身体 的 注 
视 时 长 差异 可 以 有 效 区 分 ASD 和 TD(Acc-=85.1%, Sen-=86.5%, Spe-=83.8%)。 除 此 之 外 ， 部 
分 自 闭 症 群体 存在 运动 障碍 ,有 研究 显示 姿势 控制 和 上 上 肢 运 动 等 指标 也 可 以 作为 早期 分 类 的 
依据 ， 其 应 用 准确 性 可 以 达到 90% 以 上 (Li et al., 2020; Wedyan et al., 2019). 
3.2.4 基于 多 模 态 数据 分 类 

“多 模 态 ” 是 指 表 征 意义 的 符号 系统 或 有 效 手段 的 多 样 性 ( 顾 日 国 , 2013)， 多 模 态 数据 
则 是 指 混 合 多 种 分 类 方法 、 分 类 指标 实现 研究 目的 ， 在 本 研究 中 则 指 将 量 表 、 影 像 、 行 为 等 
单一 模 态 的 数据 采集 方式 进行 整合 ， 同 时 采用 两 种 或 两 种 以 上 方法 用 于 自 闭 症 分 类 模型 构 
建 。Kang (2020) Е 3~6 岁 ASD 和 TD 的 rs-fMRI 数据 和 对 本 民族 和 其 他 种 族人 类 面孔 
反应 的 眼 动 指标 ， 结 合 支持 向 量 机 的 极 小 元 余 - 极 大 相关 (minimum redundancy maximum 
relevance, MRMR) 特 征 选择 方法 对 被 试 进行 分 类 ,发现 脑 电 和 了 眼 动 数据 同时 作为 分 类 器 数值 
输入 时 ， 分 类 准确 率 达 到 85.44%，AUC 超过 93%， 远 高 于 仅 依 照 单 一 行为 指标 分 类 66.9% 
的 准确 率 。Bosl 等 (2018) 纵 向 追踪 高 低 风 险 ASD 在 3 一 36 个 月 间 的 脑 电 数据 ,在 36 个 月 时 
采用 ADOS 测量 参与 者 的 自 闭 症 症状 严重 程度 ， 结 果 发 现 3 个 月 大 婴儿 的 脑 电 数 据 可 以 预 
测 其 3 岁 时 的 ADOS 得 分 。 此 外 ， 韩 保 祯 (2018) 也 发 现 多 模 态 信息 融合 的 脑 网 络 数据 对 于 


i 
m 


ASD 和 TD 分 类 效果 最 好 。 

机 器 学 习 应 用 于 自 闭 症 早期 分 类 研究 数据 类 型 从 单一 模 态 扩展 到 多 模 态 , 分 类 指标 类 型 
越 来 越 多 样 ; 采集 方法 从 外 显 的 行为 指标 到 内 部 神经 标记 ,技术 也 愈 发 客观 全 面 。 数据 采集 
方式 和 类 型 的 丰富 可 以 在 源头 上 助力 模型 构建 , 为 最 佳 分 类 效果 的 获得 提供 基础 。 但 我 们 也 
应 该 看 到 ， 目 前 数据 采集 还 存在 几 个 问题 需要 改善 ， 首 先 影像 技术 手段 比较 单一 ， 主 要 是 
fMRI 和 sMRI, ERP. fNIRS 等 技术 在 该 领域 的 应 用 较 少 。 其 次 ， 传 统 诊 断 工具 本 身 是 经 过 
系统 设计 的 ， 每 个 模块 有 固定 目的 ， 不 同 机 器 学 习 方 法 中 对 于 项 目 或 模块 删 减 标准 不 一 ， 得 
到 的 结果 并 不 统一 , 工具 删 减 的 依据 和 标准 缺乏 规范 性 讨论 。 传统 工具 测量 时 长 是 为 了 保证 
施 测 过 程 更 为 细致 准确 , 机 器 学 习 将 时 间 缩 短 到 十 几 分 钟 , 是否 有 可 能 出 现 信息 遗漏 导致 结 
果 偏 差 也 是 一 大 问题 。 最 后 ， 基 于 上 典型 行为 的 分 类 指标 过 于 广泛 ， 基 于 DNA, RNA 等 遗传 
物质 的 研究 却 并 不 多 见 , 不 同 研究 者 关注 的 重点 有 很 大 差异 , 如 何在 众多 指标 中 选 出 最 具 代 
表 性 的 一 种 或 几 种 指标 仍然 值得 商 榨 。 这 些 都 是 我 们 在 应 用 机 器 学 习 实 现 自 闭 症 分 类 之 前 需 
要 广泛 探讨 和 论证 的 问题 。 只 有 真正 解决 源头 性 问题 , 才 有 可 能 将 技术 的 优势 真正 落实 在 自 


闭 症 群体 身上 。 


4 基于 机 器 学 习 的 自 闭 症 早期 识别 和 诊断 研究 算法 与 流程 


41 机 器 学 习 算法 


算法 是 模型 建立 的 技术 性 要 素 。 机 器 学 习 算 法 的 分 类 非常 广泛 , 基于 学 习 方式 不 同 可 分 


为 有 监督 学 习 、 无 监督 学 习 、 半 监督 学 习 和 强化 学 习 ， 按 照 模型 结构 的 深度 又 分 为 传统 机 器 


学 习 和 深度 学 习 。 目 前 在 


自 闭 症 早期 识别 中 的 应 用 以 传统 算法 为 主 , 包括 支持 向 量 机 (Support 


Vector Machine, SYM)、 决 策 树 (Decision Tree, DT), K 最 近邻 (K-Nearest Neighbours, KNN)、 


朴素 贝 叶 斯 (Naive Bayes 


决策 树 (Gradient Boosted 


, NB)、 回 归 (Regression)、 随 机 森林 (Random Forest, RF) 和 梯度 提升 
Decision Trees, GBDT) 等 。 但 近年 来 随 着 技术 的 不 断 发 展 人工 神 经 


网 络 (Artificial Neural Network, ANN)、 卷 积 神经 网 络 (Convolutional Neural Network, CNN), 


深度 神经 网 络 (Deep Neural Networks, DNN) 和 多 层 感 知 机 (Multilayer Perceptrons, MLP) 等 深 


度 学 习 新 方法 也 逐渐 受到 了 研究 者 的 关注 (Eni et al., 2020; Raj & Masood, 2020). 


SVM 是 传统 机 器 学 


习 代 表 性 算法 之 一 ， 特 别 适用 于 二 分 类 数据 问题 。Liu 等 (2016) 的 研 


究 采 用 径 向 基 核 函数 (Radial Basis Function kernel, RBF kernel) 将 非 线 性 数据 投影 到 高 维 空间 ， 


使 数据 实现 分 离 ， 有 效 区 分 了 ASD 和 TD， 准确 率 达 88.51%。 但 有 研究 显示 ，SVM 等 传统 


算法 往往 直接 根据 特征 对 样本 进行 分 类 , 不 进行 或 只 进行 一 次 特征 变换 和 选择 , 过 于 依赖 上 
游 提 供 的 特征 , 存在 对 缺失 数据 敏感 和 多 分 类 问题 处 理 过 拟 合 问题 , 在 面 对 自 闭 症 这 一 成 因 
和 表现 复杂 群体 时 ， 效 果 存 在 局 限 (Namdeo & Singh, 2021; 杨 剑 锋 等 , 2019)。 深 度 学 习 无 需 


借助 上 游 特征 , 可 以 将 大 量 原始 数据 直接 输入 模型 , 通过 对 数据 的 多 次 变换 检测 计算 出 抽象 


T 


特征 帮助 分 类 ( 胡 越 等 , 2019)， 模 型 的 分 类 性 能 和 泛 化 能 力也 较 传 统 方法 有 所 改善 (Li et al., 


2019; Dubreuil et al., 2020)。Salari 等 (2019) 以 rs-fMRI 数据 为 分 类 指标 ， 运 用 SVM、KNN、 


RE 和 CNN 分 别 构建 分 类 器 ,发 现 CNN(Acc-=70.22%) 的 分 类 准确 率 高 于 SVM(Acc-=69.35%)、 


KNN(Acc-=62.11%) 和 RF(Acc-=59.94%). Dong 等 (2021) 以 静 息 态 脑 电 图 为 分 类 指标 构建 的 


CNN 模型 ， 分 类 准确 率 


更 是 达到 了 92.63%。 人 工 神 经 网 络 作为 深度 学 习 的 基本 组 成 部 分 ， 


也 被 证 明 具 有 较 高 的 分 类 准确 度 。Grossi 等 2017) 基 于 ANN 搭建 了 一 种 新 型 分 类 系统 ， 将 


多 比例 尺 分 级 组 织 图 


Æ IY a) Hs И Ка RA Ж (Multi-Scale Ranked Organizing Мар, MS- 


ROM/Implicit Function as Squashing Time, I-FAST) 算 法 相 结 合 ， 以 脑 电 图 像 为 判别 指标 ， 发 


现 该 算法 对 ASD ПИ 


E 确 率 高 达 100%。 但 也 有 研究 显示 ， 传 统 算法 可 以 通过 增加 分 类 器 


数量 进行 自我 优化 。 随 可 


aut 


LARCH bootstrap 再 抽样 和 决策 树 算法 相 结 合 ， 构 建树 型 分 类 器 身 


A 
A 


= 


一 


DT 分 类 效果 明显 优化 ，AUC 达到 


Е 


H. 


正 凤 ,2014)， 分 类 速度 、 准 确 性 和 抗 噪 性 能 明显 高 卫 


度 上 减轻 过 拟 合 问 题 。Wingfield 等 (2020) 开 发 的 ASD MAF, RI 


98%. 


机 器 学 习 算 法 无 需 明 确 编码 , 可 以 自动 检测 数据 中 存在 的 模式 , 处 理 
具有 强大 的 功能 优势 。 近 年 来 在 ASD 分 类 研究 中 的 应 | 
法 向 深度 学 习 过 渡 的 趋势 , 诊断 效率 大 幅 提 升 。 但 目前 超过 75% 的 研究 使 用 的 仍 


相 比 传统 识别 和 诊断 方 沪 
从 传统 外 


传统 机 器 学 习 算 法 ， 对 于 深度 学 习 
使 用 的 入 
没有 停止 。 因 


{z 
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此 未 来 研究 应 继续 


ВМА 


E 有 待 提高 。 此 外 当前 


分 


类 器 算法 ,还 可 以 在 一 定 程 


И КЕ 相 较 单一 的 


法 存在 很 大 差异 , 同一 算法 对 不 同 对 象 施 测 结果 也 有 不 同 , 对 于 最 佳 算法 的 


杂 的 非 线性 数 


NB、 


в, 


还 呈现 出 


Е 
ле 


研究 中 算法 众多 ,不同 研究 者 


深入 探讨 如 何 找 昌 


最 佳 算法 ， 更 大 程度 发 挥 技术 的 


AN 


X 


МЕ. 


效果 评价 是 模型 构建 的 指挥 棒 和 导航 塔 。 数 据 收集 和 算法 选择 后 ， 需 要 对 模型 有 效 性 加 


以 验证 。 机 器 学 习 效果 评价 一 般 是 
到 的 。 根据 原始 二 分 类 数据 特 生 
真 阳性 和 真 
( 见 表 3)。 具 体 的 模型 特 
数 占 总 村 


Еней 


=(TP+TN)/(TP+FN+FP+TN); (2) 敏 感度 (Sensitivity Sen-), 281 


Bil, NIKA HK (recall) АНИ 


阴性 是 预测 良好 中 的 正 类 和 负 类 ， 假 
FE 价 指标 包括 
FE 本 数 的 比例 。 通 常 来 说 ， 准 确 率 越 高 ， 分 类 效果 越 好 。 计 算 公 式 为 Acce- 
FE 类 中 自 闭 症 儿童 分 类 


以 专业 


И 
确 


: (1) 准 


(G3) 特异 度 (Specificity, Spe-), #8428! 


Negative Rate, TNR). itf 


VAN 


儿童 分 


自 闭 症 


类 了 


characteristic curve, КОС 曲线 ), 是 


BA 


主要 通过 计算 ROC | 


种 以 假 B 


比较 。 一 般 来 说 ,， AUC/AUROC RK, 分 类 效果 越 好 。 除 .| 


RN 


率 (Accuracy Acc-), #2487) 


上 述 四 种 常 ) 


有 了 阳性 预测 值 (Positive Predictive value, PPV)、 阴 性 预测 值 (Negative Predictive value, 


医师 诊断 为 校 标 , 计算 相关 系数 或 成 功 预 测 比例 
Е 一 般 将 分 类 效果 分 为 正 类 (Positive) 和 人 负 类 (Negative)， 其 中 


E 和 假 阳 性 是 预测 不 良 


EAN 


E 确 


得 


Ср 


FP 的 正 类 和 负 类 


类 正确 的 柱 


bk 


的 比 
E 率 (True Positive Rate, TPR)。 计 算 公式 为 Sen-=TP/(TP+FN); 
E 确 的 比例 ， 又 称 真 阴性 率 (True 
公式 为 Spe-=TN/(FP+TN); (4) 接 收 者 操作 特性 
性 率 为 X 轴 , 以 真 阳性 率 为 Y 轴 组 成 的 图 


下 面 的 面积 (Area Under ROC Curve, AUC/AUROC) 对 分 类 性 能 进 


| 线 (operating 


形 ， 


д-+ 


ÍT 


NPV). RX (false discovery rate /error rate, FDR) 等 指标 来 考察 分 类 器 效果 。 


K 3 ASD 二 分 类 数据 的 混淆 矩阵 


预测 


指标 外 ， 部 分 研究 还 


ДЕ 


АНИ 


ASD 
Е (True Positive, ТР) 
Е (False Positive, ЕР) 


{ 


BH 


BHH 


Non-ASD 
E (False Negative, FN) 
E (True Negative, TN) 
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逻辑 清晰 、 完 备 有 序 的 数据 处 理 流程 是 模型 有 效 落 实 的 显 性 表现 。 机 器 学 习 应 用 于 ASD 
早期 识别 和 诊断 大 致 经 过 以 下 四 个 步 又: 首先 是 收集 数据 阶段 ， 也 就 是 选择 ASD 分 类 所 需 
影像 、 量 表 、 行 为 等 数据 指标 。 其 次 是 原始 数据 处 理 阶段 。 该 阶段 主要 目的 是 实现 特征 选择 ， 
通过 过 采样 、 欠 采样 等 方法 对 重复 记录 、 缺 失 值 和 不 平衡 数据 进行 降 噪 ， 降 低 计 算 复杂 性 和 
提高 分 类 精度 ， 形 成 分 类 所 需 数 据 集 。 然 后 就 进入 自 闭 症 和 对 照 组 分 类 阶段 。 该 阶段 通常 会 
采用 k 折 交 叉 验 证 将 整个 数据 集 随 机 分 为 k 份 ， 其 中 1 份 作为 测试 集 (testing set), k-1 份 用 
于 训练 , 其 中 训练 的 数据 又 可 以 随机 分 为 训练 集 (training set) 和 验证 集 (validation set), 这样 交 
叉 验 证 k 次 , 每 一 份 都 可 以 作为 测试 集 进行 测试 , 平均 k 次 的 结果 ， 得 到 最 终结 果 。 具 体 流 
程 又 可 简 述 为 : 第 一 ， 输 入 训练 集 ， 采 用 机 器 学 习 算 法 进行 训练 ， 构 建 ASD 分 类 模型 ， 第 
二 ,将 验证 集 输入 模型 中 ， 比 较 模 型 预测 结果 和 “ 自 闭 症 ”标记 数据 的 区 别 ， 验 证 模型 分 类 
准确 性 ， 第 三 ， 测 试 集 测 评 模 型 分 类 性 能 。 最 后 获取 最 佳 分 类 模型 。Epalle 等 (2021) 构 建 的 
DNN 模型 就 是 遵从 了 这 一 程序 ， 借 助 ABIDE-I 中 的 脑 成 像 数 据 区 分 ASD 和 TD。 数 据 处 理 


阶段 利用 过 采样 进行 特征 选择 ， 使 CC200 集 增加 19900 个 特征 ，AAL90 和 集 增加 4005 个 特 


征 ,DOS160 集 增加 12720 个 特征 ;在 分 类 阶段 ,采用 10 折 交 叉 验 证 (10-fold cross-validation), 


С 5 折 分 层 交 叉 验 证 ($-folds stratified cross-validation) 和 留 一 法 (Leave-one-site-out) 构 建 分 类 器 
和 评估 分 类 结果 ， 在 每 一 部 分 数据 中 ， 设 置 70% 用 于 训练 ，20% 用 于 验证 ，10% 用 于 测试 。 


最 后 模型 验证 结果 显示 该 分 类 器 对 两 组 被 试 的 分 类 准确 率 可 达 78.07%。 

机 器 学 习 应 用 于 ASD 儿童 分 类 自动 分 配 训 练 集 和 测试 集 ， 经 过 过 滤 和 反复 检测 选择 和 
提取 数据 特征 ， 发 现 数据 隐藏 规律 ， 从 来 源 上 减少 了 数据 偏差 ， 增 加 了 研究 的 内 部 效 度 。 模 
型 有 效 性 的 验证 范围 涵盖 Acc-、Sen-、Spe-、AUC、PPV 和 NPV 等 多 个 维度 ， 越 来 越 注 
对 于 模型 的 客观 测量 , 也 在 一 定 程度 上 增加 了 研究 的 外 部 验证 。 但 是 通过 文献 汇总 也 能 够 看 
出 ， 目 前 研究 中 采用 的 分 类 指标 组 合 大 相 径 庭 ， 指 标 报告 的 数量 参差 不 齐 ， 缺 乏 较为 一 致 、 
普遍 被 大 家 认可 的 分 类 效果 指标 体系 。 另 外 ，Falkmer 等 (2013) 认 为 自 闭 症 分 类 模型 的 准确 
率 应 至 少 达 到 或 高 于 80% 才 可 以 被 视 为 达到 了 要 求 ,但 当前 部 分 研究 的 准确 率 甚至 不 足 60%, 
距离 分 类 准确 率 的 要 求 还 相差 不 少 (Bussu etal.,2018)。 后 续 研 究 如 何 从 技术 层面 上 继续 优化 
和 规范 这 些 问题 ， 还 需要 更 深入 的 探讨 。 

5 基于 机 器 学 习 的 自 闭 症 早期 识别 和 诊断 研究 应 用 
5.1 预测 自 闭 症 患 病 风险 因素 


Wp 


自 闭 症 作为 一 种 病因 不 明 的 神经 发 育 障碍 , 仅仅 依靠 常规 的 产 前 检查 无 法 达到 预防 目的 。 


机 器 学 习 技 术 可 以 通过 广泛 收集 影像 和 生物 指标 信息 ,充分 挖掘 和 汇总 信息 , 计算 得 出 具备 


预测 功能 的 数据 模型 ， 实 现 对 自 闭 症 患 病 风险 的 有 效 预 测 ( 刘 笑 瞪 等 , 2022)， 为 自 闭 症 病因 


探索 与 综合 诊疗 提供 新 的 方向 。 


和 孕 产 期 环境 和 母体 自身 健康 因素 都 有 可 能 影响 胚胎 发 育 质 量 ， 产 前 对 于 孕妇 (尤其 


是 
风险 孕妇 ) 和 胎儿 的 医学 检查 与 监护 可 能 有 助 于 发 现 自 闭 症 风 险 因素 。 机 器 学 习 可 以 通过 


A 


Е 


X 


a 


超声 波 检 查 、 羊 膜 腔 穿 刺 、X 射线 检查 、 绕 毛细 胞 检查 、 胎 儿 镜 检查 等 收集 的 影像 信息 和 生 
物 标 记 物 信息 ,推测 ASD 患 病 影响 因素 。 如 Сау 等 (2021) 通 过 收集 胎儿 的 超声 波 测量 值 ( 包 


括 股 骨 长 度 、 头 围 、 腹 围 等 ) 和 生物 学 特征 (如 IgG 巨细 胞 病毒 水 平等 ) 预 测 新 生 儿 患 自 闭 症 风 


险 ， 采 用 最 小 绝对 收缩 和 选择 算法 (Least Absolute Shrinkage and Selection Operator, LASSO), 


DT 和 极端 梯度 提升 (eXtreme Gradient Boosting, XGBoost) 算 法 构建 分 类 模型 ， 研 究 结 果 显 示 


模型 阳性 预测 值 可 达 77%。 母 体 免疫 性 疾病 家 族 史 、 母 体 对 巨细 胞 病毒 的 免疫 力 、 孕 晚期 胎 


儿 股 骨 长 度 、 孕 晚期 胎儿 
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胞 数量 、 新 生 儿 心率 和 性 别 等 10 项 指标 可 以 作为 ASD 预测 标 


记 物 。 基 因 是 决定 生命 健康 的 内 在 因素 。 基 因 检 测 可 以 提取 细胞 中 的 DNA 分 子 信息 ， 确 定 


新 生 儿 基因 类 型 和 缺陷 。 机 器 学 习 技术 通过 梳理 复杂 的 遗传 信息 , 可 以 帮助 发 现 与 自 闭 症 患 
病 有 关 的 遗传 因素 。 


Bahado-Singh 等 (2019) 利 用 450k 甲 基 化 芯片 (mnfinium 


HumanMethylation450 BeadChip) 检 测 ASD 和 TD 新 生 儿 血 斑 中 的 白细胞 DNA， 发 现在 胞 喀 


啶 基因 中 CpG 位 点 甲 基 化 异常 显著 ， 预 测 结果 AUC 为 100%。 同 时 研究 者 还 发 现 自 闭 症 在 


EIF4E、FYN、SHANK1、VIM、LMX1B、GABRB1、SDHAP3 和 PACS2 基因 中 存在 表 观 遗 


传 调控 障碍 。 也 有 学 者 报告 长 链 非 编 码 RNA (long non-coding RNA, IncRNAI) 也 能 够 用 于 预 


WUE J LEE ASD 风险 (AUC=83.9%; Gök., 2018)。Qiu 等 (2020) 基 于 SVM 构建 的 预测 模型 


显示 ， 一 碳 单 位 代谢 (folate-dependent one carbon metabolism, FOCM)、 转 硫 作 用 
(transsulfuration, TS) 中 的 多 种 代谢 物 以 及 母体 孕前 和 孕期 摄 入 的 叶酸 含量 也 可 以 作为 新 生 儿 
自 闭 症 风 险 预测 的 指标 ， 该 模型 预测 的 准确 率 达 到 96% 以 上 。 借 助 机 器 学 习 对 HR-ASD 家 


族 婴 儿 的 大 脑 功 能 连接 磁 共 振 成 像 (functional connectivity Magnetic Resonance Imaging, 


frMRD 进 行 追 踪 研 究 ,将 ASD 风险 预测 年 龄 提前 到 了 胎儿 出 生 后 6 个 月 (Emerson etal.,2017)。 


52 筛 查 高 危 自 闭 症 


早期 自 闭 症 第 查 可 以 在 大 范围 人 群 中 发 现 高 危 儿 童 ,对 于 改善 自 闭 症 儿 童 社会 适应 、 预 


防 继 发 性 发 育 障碍 和 减轻 家 庭 与 社会 负担 具有 重要 意义 ( 陈 光华 等 , 2022)。 如 果盘 查 工 作 可 


以 直接 由 家 长 或 其 他 熟悉 儿童 的 人 员 操 作 ， 就 可 以 更 早 发 现 潜在 ASD 患者 ， 避 免 错 失 干 预 


盘查 的 移动 应 用 程序 


时 机 。Thabtah 等 (2018) 借 助 机 器 学 习 模 型 简化 传统 量 表 (CHAT、AQ), A 


ASD Tests， 该 工具 可 以 在 手机 端 免费 下 载 使 用 ， 适 用 范围 涵盖 婴 


F 发 了 一 球 适 合 ASD 


幼儿 期 (1 一 3 岁 )、 儿 童 期 (4 一 11 岁 )、 青 少年 期 (12 一 16 岁 ) 和 成 人 期 (17 岁 之 后 ) 四 个 阶段 ， 
每 个 阶段 仅 有 10 道 测试 题 ， 测 试 时 间 在 3 一 $ 分 钟 以 内 ， 非 专业 人 员 也 能 轻松 操作 。 研 究 发 


现 该 程序 对 于 儿童 、 


下 


率 分 别 可 以 达到 98.30%、96.88% 和 99.53%， 能 够 | 


57 
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率 均 高 于 95%， 


分 类 性 能 良好 (Thabtah et al., 2019). Raj 和 Masood(2020) 基 于 个 体 性 别 、 种 族 、 是 否 先天 黄 
JASE 21 项 特征 构建 自 闭 症 得 查 模型 ， 发 现 CNN 在 儿童 、 青 少年 和 成 人 群体 中 筛 查 的 准确 
快速 地 在 大 范围 人 群 中 找 出 自 闭 症 患者 。 
除 此 之 外 , 神经 影像 数据 和 行为 表现 作为 风险 识别 重要 的 内 外 部 参照 , 也 被 广泛 应 用 于 筛 查 
或 诊断 模型 的 构建 ， 


取得 了 令 人 满意 的 效果 (Rakik et al., 2020; Dickinson et al., 2020; Lai et al., 


2020; Qiu et al., 2020). 


53 辅助 诊断 自 闭 症 


诊断 是 对 往 查 出 的 高 危 儿 童 做 更 全 面 细 致 的 专业 检测 ,传统 诊断 方法 通过 观察 儿童 外 在 


行为 和 家 长 报告 方式 获取 数据 , 易 受 评估 人 员 主 观 性 和 报告 者 回忆 偏差 影响 诊断 过 程 中 存 


НЕД 


在 的 等 待 周期 长 、 
以 纳入 大 量 客观 分 类 指标 ， 在 一 定 程 度 - 


RSF 


问题 也 阻碍 了 后 续 临 床 干预 的 实施 。 机 器 学 习 辅助 专业 人 员 诊 断 可 


上 减少 主观 施 测 浆 端 ,还 能 够 减少 耗 时 ， 降 低 等 待 成 


本 。 社 交 机 器 人 是 ASD 智能 诊断 中 的 常用 工具 ， 其 设计 有 趣 亲 切 ， 通 过 丰富 的 面部 和 肢体 


语言 与 受 测 者 沟通 ， 可 以 减少 自 闭 症 社交 恐惧 ( 黄 胜 玉 , 2018). Ramirez-Duque 等 (2019) 采 用 
I TD 幼儿 与 ONO 社交 机 器 人 互动 的 行为 特征 ， 并 利用 CNN 
和 助 专业 人 员 对 ASD 儿童 进行 诊断 , 发 现 该 模型 可 以 实现 ASD 
用 性 与 临床 专家 诊断 结果 基本 一 致 。 影 像 和 传 


RGBD 传感器 采集 HR-ASD Я 
构建 两 类 儿童 面孔 识别 模型 , 畏 
的 自动 化 识别 ， 花 费时 间 不 超过 40 分 钟 ， 准 而 


统 量 表 也 为 机 器 学 习 


ADI-R 为 指标 构建 的 模型 诊断 准确 率 高 于 94%， 灵敏度 也 超过 90%. Abdolzadegan 等 (2020) 


对 3 一 12 岁 的 ASD 和 TD МН 


94.68%- 


甫 助 诊断 提供 了 有 效 订 


54 管理 评估 和 干预 过 程 


自 闭 症 早期 预测 、 识别 和 诊断 的 最 终 目的 是 为 了 给 儿童 提供 行 之 有 效 的 早期 干预 。 收 自 


自 闲 症 群体 计 


FE 佑 和 干预 过 程 信息 , 追踪 干预 施行 效果 , 可 以 为 确定 儿童 生怕 


驾 点 提供 思路 。 然 而 传统 的 得 查 、 诊 断 、 干 


以 对 信息 ; 


行 比较 系 


E 据 (Bone et al., 2016)。Tariq 等 (2018) 以 ADOS 和 


有 图 进行 分 析 ， 基 于 SVM 和 KNN 建立 诊断 模型 ， 准 确 率 达到 


ny 


a 


病理 机 制 和 治疗 
预 和 预后 再 评 是 几 个 相对 独立 和 分 散 的 环节 ， 难 


统 的 收集 和 整合 , 也 就 更 难 发 现 和 把 握 数据 的 内 在 趋势 和 隐藏 特征 , 造 


成 了 数据 的 浪费 。 基 于 机 器 学 习 的 分 类 一 大 优势 还 在 于 对 数据 的 有 效 利 用 , ERA МЕНЕ 
预 数据 基础 上 构建 一 体 化 智能 评估 和 干预 管理 系统 , 增强 对 自 闭 症 儿 童 诊断 和 干预 的 跟踪 式 
监控 。Cognoa (Cognoa ASD Screener Cognoa ASD Diagnosis Aid) 是 一 款 以 机 器 学 习 技 术 为 支 
撑 的 新 型 ASD 评估 程序 ， 兼 具 筛 查 、 诊 断 和 风险 预测 功能 。 该 程序 主要 服务 对 象 为 婴 幼儿 
至 学 龄 前 期 自 闭 症 儿童 (18 个 月 一 5 岁 )， 需 要 家 长 完成 一 份 包含 15 道 题目 的 问卷 ， 并 上 传 
两 个 以 上 时 长 1 一 2 分 钟 的 儿童 日 常生 活 视频 (如 用 餐 、 游 戏 时 间 )， 资 料 上 传 完成 后 台 自 动 
评分 输出 风险 值 ， 整 个 过 程 约 为 15 分 钟 (Kanne et al., 2018)， 每 次 测评 结束 程序 会 自动 保存 
结果 。2021 年 6 月 ， 美 国 食品 和 药物 监管 局 (Food and Drug Administration, FNA) 对 该 程序 应 
于 自 闭 症 患 者 诊断 的 可 行 性 进行 核定 ， 发 现 来 自 14 家 医疗 中 心 的 425 名 儿童 程序 诊断 结 
果 与 专家 结论 基本 完全 一 致 , 获 批 准 上 市 使 用 。 基 于 机 器 学 习 技 术 建 立 的 自 闭 症 图 片 评估 智 
能 管理 系统 ， 还 可 以 记录 ASD 从 早期 筛 查 到 干预 治疗 过 程 中 儿童 能 力 变化 数据 ， 获 得 儿童 
预后 再 评 信息 (Perera etal.,2017)。 人 工 神经 网 络 支 持 的 专家 系统 ， 甚 至 可 以 在 无 预先 编程 设 
定 的 情况 下 机 智 应 对 和 解决 不 确定 性 问题 , 为 自 闭 症 诊断 和 干预 提供 实时 建议 , 是 临床 评估 
中 的 “得 力 助 手 ”( 新 宇 倡 等 , 2022; Rahman et al., 2020; Negin et al., 2021). 

综 上 所 述 , 机 器 学 习 在 自 闭 症 分 类 中 的 应 用 涵盖 病因 分 析 ， 患 病 风 险 预测 , 潜在 危机 人 
Вет г, 辅助 诊断 和 智能 病程 管理 。 这 些 工作 的 开展 有 助 于 增加 从 业 人 员 对 自 闭 症 病因 病程 
兰 息 的 掌握 ， 实 现 筛 查 、 诊 断 、 和 干预 和 预后 再 评 的 动态 化 管理 ， 节 约 长 期 随访 所 需 的 人 力 物 
力 资源 ， 更 快 找 出 众多 个 性 因素 中 的 “共性 ” 提高 诊疗 的 有 效 性 ， 这 也 是 我 们 未 来 临床 诊 
疗 可 以 借鉴 的 一 个 思路 。 

O 6 机 器 学 习 应 用 于 自 闭 症 儿 童 识别 和 诊断 的 优势 与 不 足 

6.1 优势 

目前 机 器 学 习 技 术 已 经 应 用 于 自 闭 症 儿 童 早 期 预测 、 筛 查 和 诊断 ， 其 客观 性 、 便 捷 性 和 
有 效 性 经 过 了 较为 广泛 的 验证 , 分 类 性 能 在 不 断 的 优化 和 完善 中 也 表现 越 来 越 好 , 部 分 智能 
工具 也 开始 推广 应 用 。 相 较 于 经 验 诊 断 和 传统 测量 , 机 器 学 习 的 融入 体现 了 人 人工 智能 技术 的 
一 些 优势 ,集中 表现 在 四 个 方面 。 第 一 ， 机 器 学 习 获取 和 整理 数据 指标 的 能 力 更 强 ， 有 助 于 
构建 多 模 态 分 类 模型 。 传 统 分 类 方法 主要 是 通过 对 外 显 行 为 指标 的 观测 得 出 结论 , 参考 的 变 
EAR, 机 器 学 习 可 以 集合 多 种 类 型 、 不 同 观测 方法 获得 的 数据 指标 , 兼顾 内 在 和 外 部 影响 
因素 , 减少 主观 误差 .提高 预测 和 识别 结果 的 全 面 性 和 客观 性 。 此 外 ,机 器 学 习 模型 还 能 够 
跟踪 评估 和 诊断 过 程 管理 , 增加 了 数据 的 利用 率 。 第 二 ,机 器 学 习 降 低 了 预测 和 识别 的 时 间 


成 本 ， 提 高 了 测评 效率 ， 减 经 诊断 人 员 压 力 。 分 类 模型 的 建立 一 方面 可 以 通过 大 范围 筛 查 ， 


快速 发 现 高 风险 自 闭 症 患 者 , 尽早 引起 家 长 和 其 他 相关 人 员 的 警觉 , 另 一 方面 还 可 以 通过 减 
少 测试 项 目 、 缩 短评 测 流程 等 有 效 压 缩 诊 断 时 间 , 降低 施 测 的 等 待 时 间 , 减 少 专 业 医 师 压力 。 


第 三 , 机 器 学 习 增加 了 五 


究 的 内 外 部 效 度 。 机 器 学 习 的 建 模 过 程 和 计算 原理 区 别 于 传统 方法 ， 


可 以 自动 将 原始 数据 分 为 训练 集 和 验证 集 ， 无 需 数 据 生成 模型 和 参数 估计 直接 输入 性 能 指 
标 , 模型 还 可 以 随 样本 数量 累积 不 断 优化 ,提升 了 研究 的 内 部 效 度 和 外 部 推广 力 ， 也 有 利于 
加 速 模 型 应 用 于 实践 的 速度 ,第 四 ,机 器 学 习 可 自动 提取 关键 特征 , 帮助 建立 风险 预警 机 制 。 


机 器 学 习 可 以 捕捉 肉眼 无 法 观测 到 的 细微 表情 或 身 势 动作 变化 , 减少 关键 指标 的 遗漏 , 还 适 
] 于 非 线性 数据 , 可 以 从 纷繁 复杂 的 数据 中 心 抽 丝 剥 草 , 更 适合 分 析 ASD 这 一 类 成 因 不 明 、 
结构 复杂 的 疾病 ， 降 低 症 状 恶 化 的 可 能 。 尤 其 是 对 于 婴 幼 儿 和 学 龄 前 期 儿童 ， 早 发 现 、 早 干 


预 能 够 发 挥 最 大 效益 ,帮助 这 些 孩 子 及 其 家 庭 获得 更 高 的 生活 质量 , 减少 因 障 碍 引发 的 各 种 


社会 适应 问题 。 


6.2 不 足 与 展望 


虽然 机 器 学 习 在 ASD 儿童 识别 和 诊断 中 具有 一 定 的 方法 学 优势 ， 相 关 研 究 成 果 也 逐步 


增多 , 但 距离 大 范围 应 用 还 有 一 定 距 离 , 其 面临 的 具体 问题 与 可 能 的 解决 方法 可 总 结 为 以 下 


三 个 方面 。 


首先 ， 缺 少 孕 产 妇 和 新 生 儿 自 闭 症 病 源 追 踪 研 究 。 遗 传 学 研究 结果 表明 ， 常 见 的 遗传 变 


化 ， 如 基因 突变 、 易 位 


、 倒 位 和 拷贝 数 变异 等 都 可 能 与 ASD 的 产生 存在 一 定 程度 的 相关 ， 


BA ASD 的 新 生 儿 拷贝 数 变异 频率 明显 高 于 TD (Sanders et al., 2011)。 也 有 研究 报告 ASD 


可 能 是 由 影响 细胞 增殖 


、 迁 移 和 许多 其 他 基本 过 程 的 致 病 事件 序列 导致 (Caly et al., 2021). 


对 自 闭 症 儿 童 大 脑 的 尸检 报告 也 显示 其 前 额 叶 皮层 神经 元 异常 过 剩 , 还 存在 脑 过 度 生 长 和 巨 


U 


脑 问题 (Tyzio et al., 2014). Rahman 等 (2020) 还 发 现 父 母 的 年 龄 、 家 庭 病 史 也 会 增加 新 生 儿 患 


自 闭 症 的 风险 。 这 些 证 据 表 明 自 闭 症 受 遗传 因素 的 影响 , 且 这 些 病症 在 个 体 胚胎 形成 和 发 展 


时 期 可 能 就 已 经 出 现 (Caly et al., 2021 )。 除 遗传 因素 外 ， 孕 产妇 暴露 于 危险 环境 也 是 自 闭 症 


患 病 的 易 感 因素 之 一 。 Choi 等 (2016) 研 究 发 现 , ASD 发 病 率 增加 与 母体 病毒 或 微生物 感染 、 
发 热 以 及 免疫 系统 疾病 有 关 。 在 孕期 服用 药物 ， 特 别 是 丙 戊 酸 钠 (sodium valproate)， 和 维 生 
素 缺 乏 可 能 导致 胎儿 截 患 自 闭 症 。 剖 腹 产 、 早 产 和 新 生 儿 并 发 症 等 问题 也 会 增加 ASD 的 发 
病 比例 (Cloarec et al., 2019)。 这 提示 我 们 个 体 生命 早期 的 内 外 部 环境 是 导致 自 闭 症 出 现 的 关 


键 因素 。 


理 清 自 闭 症 个 体 发 展 初期 病理 ,病因 和 病程 因素 可 能 会 为 患 病 风险 预测 和 防 控 提 供 新 的 


ар, 但 遗憾 的 是 当前 文献 研究 中 还 昔 助 孕 产 期 数据 进行 自 闭 症 识别 的 研究 。 当 前 文 
献 中 仅 有 的 两 篇 ,Caly 等 (2021) 采 集 了 孚 产妇 从 孕 早 期 到 胎儿 出 生 后 1 天 内 常规 生物 标记 物 
和 超声 测量 值 来 预测 自 闭 症 , 并 与 儿童 4 一 $ 岁 时 诊断 结果 进行 比较 , 预测 准确 率 达 到 了 77%。 
Bahado-Singh 等 (2019) 采 集 249 种 新 生 儿 (出 生 24 一 79 小 时 ) 白 细胞 表 观 基因 组 标志 物 , 成 功 
预测 了 后 期 被 诊断 为 自 闭 症 的 儿童 (Sen-=97.5%, Spe-=100% )。 这 启示 我 们 如 果 能 在 胚胎 形 
成 和 新 生 儿 发 展 初期 , 广泛 收集 孕 产 妇 及 其 家 庭 成 员 健 康信 息 ， 关注 遗传 和 环境 中 可 能 的 致 
ай ж, 尤其 是 较为 稳定 的 生物 标记 物 ,借助 机 器 学 习 模型 庞大 的 数据 梳理 功能 提取 其 中 的 
共性 因子 ， 是 否 就 有 可 能 逐步 摆脱 “被 动 等 候 ” 的 局 面 ， 变 为 “主动 防御 ”。 因 此 未 来 研究 
可 在 遵循 伦理 原则 的 基础 上 , 尝试 借助 孕期 第 查 和 新 生 儿 体检 等 环节 建立 儿童 生理 病理 信息 
数据 库 ， 收 集 儿 童 (尤其 是 高 危 家 族 儿 童 ) 从 胚胎 期 到 出 生 期 间 的 过 程 性 信息 ， 也 可 借鉴 美国 
儿科 学 会 的 做 法 , 在 确保 参与 者 知情 同意 的 前 提 下 于 固定 时 间 段 (如 出 生 时 、 出 生 后 8 个 月 、 
18 个 月 等 ) 进 行 长 期 追踪 研究 (Wan et al., 2019), 获取 自 闭 症 个 体 发 展 初期 病源 的 原始 性 资料 ， 
归纳 可 能 的 风险 因素 ， 及 早 规避 和 预防 这 一 障碍 的 出 现 。 
其 次 ， 缺 少 标准 化 模型 分 类 数据 体系 。 机 器 学 习 模型 为 海量 信息 处 理 提 供 了 可 能 性 ,但 
技术 本 身 对 于 数据 的 包容 也 可 能 成 为 一 把 双 刃 剑 。 现 有 机 器 学 习 分 类 指标 虽然 形式 多 样 , 但 
内 容 繁杂 ， 缺 少 清晰 明确 的 分 类 依据 和 系统 化 、 规 则 化 的 应 用 效果 分 析 ,， 测评 结果 的 可 验证 
程度 不 高 。 以 基于 行为 的 单一 模 态 分 类 指标 为 例 , 研究 者 所 使 用 的 具体 指标 包含 了 重复 刻板 
行为 、 反 抗 行为 、 自 我 伤害 行为 、 精 细 / 粗 大 动作 、 社 会 交往 行为 、 社 会 性 微笑 、 共 同 注意 、 
с 模仿 、 眼 神 变化 、 表 达 性 和 接受 性 语言 等 数 十 种 行为 表现 。 不 同行 为 表现 又 可 以 细 化 为 更 微 
rr 观 的 分 类 指标 , 仅 眼 神 变化 一 项 就 可 以 分 化 出 眼神 检索 (eye scanning), 眼神 追随 (eye tracking) 
和 眼神 接触 (eye touching/contacting) 等 多 种 范式 。 但 是 即使 是 同一 行为 表现 ， 得 出 的 结论 也 
不 完全 一 致 (Wan et al., 2019; Shic et al., 2014)。 基 于 量 表 的 分 类 也 出 现 了 这 一 问题 ， 研 究 文 
献 中 包含 多 种 分 类 工具 ， 不 同 工 具 强 含 的 信息 和 施 测 对 象 也 不 一 致 。 即 使 是 同一 测验 工具 ， 
项 目的 筛选 标准 与 结论 也 不 完全 统一 (Emerson et al., 2017)。 基 于 多 模 态 的 分 类 模型 ， 在 融合 
多 元 信息 过 程 中 混杂 了 更 多 与 测评 关联 程度 不 高 的 信息 , 对 测试 准确 性 有 一 定 干扰 。 多 种 模 
态 的 组 合 ,同一 模 态 不 同 分 类 指标 的 组 合 ,为 研究 者 提供 了 更 多 分 类 标准 选择 的 同时 ， 也 带 
来 了 更 多 的 测量 误差 ， 不 利于 研究 结果 的 推广 和 泛 化 。 

因此 模型 构建 过 程 中 应 重视 分 类 指标 内 部 秩序 性 ， 梳 理 出 分 类 指标 选取 的 标准 与 依据 ， 

逐步 确定 出 一 部 分 稳定 性 强 、 适 应 范围 广 、 准 确 度 高 的 分 类 指标 , 构建 更 具 科 学 性 和 稳定 性 

的 分 类 指标 体系 。 有 研究 者 提出 ， 年 龄 可 以 作为 分 类 指标 划分 的 一 个 依据 。Liu 等 (2016) 的 
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完 显示 婴 幼 儿 和 儿童 期 ASD 识别 更 适用 于 眼神 交流 .手势 和 面部 表情 等 非 语言 行为 特征 ， 
青少年 ASD 则 更 应 侧重 于 和 同伴 的 语言 交流 与 情感 互动 。 随 着 年 龄 增长 ， 社 会 性 沟通 与 情 
联结 成 为 更 重要 的 分 类 指标 。 此 外 , 大 脑 的 变化 经 常 出 现在 临床 表现 之 前 且 具 有 较 高 的 稳 


定性 (Wolff et al., 2012; Wolff et al., 2015; Elsabbagh et al., 2012)， 因 此 分 类 过 程 中 应 特别 重视 
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客观 影像 指标 的 应 用 (Hazlett et al., 2017; Emerson etal.,2016)。 言 语 智商 、 自 闭 症 严 重 程度 等 
经 过 验证 的 也 较为 容易 收集 的 分 类 标准 也 可 以 直接 纳入 分 类 体系 区 atuwal et al.,2016)。 但 是 
这 类 判别 标准 仍 相 对 宽泛 ,无 法 完全 满足 自 闭 症 特异 性 对 指标 选取 的 精细 化 要 求 。 未 来 研究 
可 在 已 有 研究 成 果 的 基础 上 ， 一 方面 继续 细 化 行为 、 量 表 、 影 像 等 指标 适用 范围 ， 按 照 分 类 
性 能 (准确 性 、 稳 定性 等 ) 对 具体 指标 进行 规则 排序 ， 另 一 方面 应 探究 不 同 模 态 间 如 何 有 机 结 
г. Пан, 兼顾 自 闭 症 患 儿 的 内 部 神经 机 制 和 外 在 行为 表现 ， 更 好 地 激发 多 模 态 数据 隐 
藏 的 价值 。 

最 后 , 理论 模型 向 现实 应 用 的 转化 还 未 完全 成 熟 。 机 器 学 习 可 以 帮助 家 长 或 其 他 从 业 人 
员 提前 知晓 疾病 风险 ， 及 早 制定 康复 方案 。 但 是 现 有 研究 仍 停留 在 模型 构建 的 理论 阶段 ， 模 
型 应 用 到 实践 中 还 需要 慎重 思考 以 下 几 个 问题 。 一 是 研究 样本 对 总 体 的 代表 性 。 已 有 研究 模 
型 中 选用 的 被 试 通常 是 经 过 选择 的 , 多数 为 高 风险 自 闭 症 家 族人 群 ,， 自 闭 症 所 占 比 重 远 超 典 
型 发 展 人 群 正常 值 20% 一 33%; 1%)， 评 估 结 果 若 直接 应 用 到 普通 人 群 中 是 否 能 够 兼容 
(Thabtah, 2019; Rahman et al., 2020); 二 是 模型 的 适用 性 和 可 推广 性 。 受 限于 研究 可 行 性 因 
素 ， 目 前 超过 1/3 的 研究 样本 量 不 足 300 人 ， 可 能 存在 采样 偏差 ， 且 很 少 有 研究 报告 成 果 在 
不 同文 化 背景 、 地 理 区 域 被 试 群体 中 的 验证 ， 理 论 模 型 的 泛 化 能 力 还 不 能 确定 (Mazumdar et 
al., 2021; Liaqat et al., 2021)。 三 是 算法 的 准确 度 和 稳定 性 有 待 改善 。 当 前 模型 仍 多 采用 为 传 
统 机 器 学 习 算 法 ， 部 分 模型 分 类 准确 率 尚 不 足 60%， 稳 定性 也 难以 满足 大 范围 施 测 要 求 。 四 
是 模型 功能 较为 单一 。 当 前 研究 成 果 只 能 对 个 体 是 否 为 自 闭 症 做 简单 的 三 分 类 判断 , 极 少 直 
接应 用 于 诊断 (Millar et al.,2019)。 对 于 计算 模型 应 用 于 预测 和 评估 过 程 管理 的 功能 也 是 浅 洽 
辑 止 、 不 够 深入 。 五 是 应 用 受众 对 模型 的 认可 度 仍 需 提高 。 当 前 ASD Tests. Cognoa 等 操作 
简便 的 智能 识别 软件 已 经 可 以 轻松 地 在 手机 端 下 载 获得 , 上 传 视 频 或 完成 测试 题目 就 可 以 快 
速 获 得 盘查 结 果 ， 但 是 绝 大 多 数 家 长 、 教 师 甚 至 是 相关 专业 从 业 人 员 并 不 了 解 这 些 软件 。 即 
使 家 长 等 相关 人 员 知 晓 这 些 施 测 工 具 ， 关 系 到 识别 尤其 是 “诊断 ”结果 ， 对 于 工具 的 认可 和 
接受 程度 可 能 也 难以 达到 研究 者 预期 .对 比 传统 方法 , 专业 医师 经 过 长 时 间 观 察 和 家 长 访谈 ， 
合 高 度 结构 化 量 表 慎 重 考 量 得 出 结果 , 仅 ADI-R 量 表 一 项 施 测 时 间 就 长 达 2.5 小 时 , 过程 
薄 含 大 量 自然 真实 环境 中 的 人 际 互 动 线索 (Abbas etal., 2020)。 机 器 学 习 模型 在 缩短 施 测 时 间 
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的 同时 能 否 得 到 真实 有 效 的 数据 , FE BC HE AN UI ARE хе тата at MOT AR, 评估 结果 
如 何 解 释 , 评估 结果 如 何 应 用 于 后 续 干 预 与 康复 , 这 些 都 是 家 长 或 其 他 应 用 受众 会 关注 的 问 
题 。 随 着 机 器 学 习 技 术 的 不 断 成 熟 , 上 述 问 题 更 深入 的 思考 与 论证 将 有 助 于 加 快 推进 理论 模 
型 向 实践 转化 的 步伐 。 未 来 研究 可 在 丰富 研究 对 象 和 优化 机 器 学 习 算法 的 基础 上 , 充分 调研 
不 同 受众 的 实际 需求 与 困扰 ， 有 针对 性 的 解决 问题 ,同时 增加 对 理论 研究 成 果 的 宣 导 ,在 实 
践 中 不 断 加 深 理论 模型 的 渗透 与 推广 。 
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Abstract: Early detection, early diagnosis and early intervention are the consensus of 
education and rehabilitation of autistic children. However, limitations of traditional identification 
and diagnosis methods and lack of professionals often lead to autistic children missing the best 
expectations. In order to improve this situation, in recent years, machine learning, with its 
advantages of objectivity, accuracy, simplicity and flexibility, has been gradually applied to the early 
prediction, screening, diagnosis and evaluation of autism, and accumulated rich achievements. 


However, machine learning has limitations in the selection of research objects, the collection of 


classified data, the application of theoretical models and so on. In Ше future, Ше research will 
promote the construction of the tracking database of maternal and newborn pathophysiological 
information and establish a standardized model classification index system. At the same time, it will 
continue to optimize the algorithm research and accelerate the transformation of the theoretical 
achievements of intelligent autism identification and diagnosis into practice. 


Key words: Machine learning, Autism, Early Identification and Diagnosis, Systematic review 
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附录 1 机 器 学 习 算 法 与 分 类 模型 性 能 汇总 表 


序号 ”国家 作者 l Сана 主要 数据 指标 算法 方法 ИВ 
样本 量 年 龄 性 别 ( 男 %) Acc-/Sen-/ Spe-/AUC 
1 美国 Abbas et al.(2018) 162(ASD+non) 18~72 个 月 / 家 长 问卷 ,家 庭 视频 ВЕ -/100%/97.7%/99.7% 
2 美国 Abbas et al.(2020) 375(ASD+non) 18~72 个 月 / 家 长 问卷 ,家 庭 视频 ,医生 问卷 GBDT -/90%/83%/ 92% 
3 伊朗 Abdolzadegan et al.(2020) 34ASD,11HC 3 一 12 岁 88.2;54.5 jà E A SVM, KNN 94.68%/100%/-/- 
42 法国 Abraham et al.(2017) 871 (ASD+TC) 6 一 64 #7 83.5 fMRI SVC, RR 66.9%/53.2%/78.3%/- 
Sp 美国 Achenie et al.(2019) 14995(ASD+nom) 16--30 个 月 46.51 个 人 信息 ,M-CHAT-R fNN 99.72%/73.8%/99.9%/- 
6 美国 Bahado-Singh et al.(2019) 14ASD,10Controls 新 生 儿 (24 一 79 小 时 ) / 白细胞 DNA DL, RF, SVM, GLM, PAM, LDA -/97.5%/100%/100% 
了 以 色 列 Ben-Sasson et al.(2016) 189 (LR+MR+HR) 1.25 个 月 一 18 # 84.7 父母 问题 DT, 最 小 二 乘法 AUC=82% 
8 美国 Bone et al.(2016) 1264ASD,462 non 4 一 55.1 岁 / ADI-R, SRS SVM -/89.2%/59%/- 
oN 英国 Bosl et al.(2018) 99HR,89LR 3 个 月 一 3 岁 / fi FE A KNN, RF, SVM -/100%/100%/- 
16N 荷兰 Bussu et al.(2018) 232(HR+LR) 8 一 36 个 月 50 ADOS, AOSI, VABS, MSEL LSSVM 57.5%/79.6%/52.2%/71.3% 
1E 法 国 Caly et al.(2021) 63ASD,189NT 妊娠 期 81;48.7 超声 波 ,生物 测量 LASSO, DT XGBoost -/41%/96%/- 
12 中 国 Dong et al.(2021) 86ASD,89TD 3 一 6 岁 / 脑 电 图 CNN Acc-=100% 
13 美国 Duda et al.(2016a) 2775ASD,150ADHD 13~163 个 月 83.9;62 SRS DT, RF, SVC, LR, LASSO, LDA AUC=96.5% 
14 美国 Duda et al.(2016b) 222(ASD+non) 16 个 月 一 17 » 76.1 ADI-R ADTree -/89.9%/79.7%/- 
15 美国 Duda et al.(2017) 200ASD,114ADHD 2 一 17 岁 80.6;65.5 SRS ENet, LR, SVM, LDA, RR AUC=89% 
16, 美国 Dickinson et al.(2020) 36HR,29LR 3 一 18 个 月 / 脑 电 图 SVM r=0.76 
17 美国 Emerson et al.(2017) 59HR 6 一 24 个 月 69.5 fcMRI SVM 96.6%/81.8%/100%/- 
18 以 色 列 Eni et al.(2020) 56ASD,6TD,100ther av4 岁 ;av3 #;ау4 ” | 87.5;83.3;90 语音 特征 MLR, SVR, FC-DNN, CNN r=0.72(ADOS) 
19 中 国 Epalle et al.(2021) 506ASD,532TC avl0~35 # 87.7;82.1 fMRI MISO-DNN, PNN Acc-=79.13% 
20 美国 Eslami et al.(2019) 550ASD,485HC avl0~34 # 81.5;88.7 fMRI SMOTE, SVM, RF 68.2%/66.7%/69.4%/74.4% 
21 意大利 Eugenia et al.(2020) 26ASD,24CAS, 18TD 34~74 个 月 77;75;72 sMRI SVM AUC=76%(ASD vs TD); 
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FRF 
NB， 贝 叶 斯 网 络 , KNN, LR, ВЕ, SVM 
MGOA, GOA, КЕ, KNN, NB, LR 
TwIST, MSROM, MSE, PCA, ANN 
DNN 
DT 


SVM, ARIA 
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SVM, KNN 
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MLP, SVM, GNB, CNN, LSTM 
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SVM, NB, RF 
LR, ANN/MLP, RF 


72.7%/80.7%/63.1%/- 
83.6%/90.2%/98.8%/83.9% 
100%/100%/100%/- 
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Acc-=74.8% 
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-/95.7%/91.3%/97.4% 
LR, LASSO, RR, ENet, LILR, L2LR, LDA AUC=93,3%(M2);95%(M3) 


Acc- > 96% 


67.23%/68%/66%/73% 
90%/82.6%/100%,/- 
88.51%/93.1%/86.21%/89.63% 
68.5% /68%/50%/- 
-/71%/72%/71% 
79.28%/-/-/77.68% 


AUC=64.6% 
Acc-=86.5% 


Acc-=81.18(FF);83.35(SF) 
96.5%/35.4%/99.3%/72.7% 


an 栈 式 自动 编码 器 , MLP 85.06%/82%/89%/- 


Raj et al.(2020 292C,104T,704A “C&T&A” / 个 人 特征 NB, SVM, LR, ANN, KNN, NN, CNN 98.3%/96.79%/100%/- 
j 


Rrtico et al.(2016) 41ASD,40 Controls 22~72 个 月 51.2;50 MRI SVM AUC=81.0( 男 ) 
Shahamiri et al.(2020) 6075(ASD+non) “T&C&TE&A” 58 AQ-10, Q-CHAT-10 CNN, C4.5, BN, Ridor, DL 97.95%/98.63%/96.53%/- 
Salari et al.(2019) 505ASD,530TC avl0~33.7 # 87.7;82.1 fMRI CNN, SVM, KNN, RF 70.22%/77.46%/61.82%/74.86% 
Sen et al.(2018) 1783 av0 一 30 #2 72.6 sMRI, fMRI SVM, PCA Acc-=67.3%; 64.2% 
Sewani et al.(2020) 539ASD,573TC «с» / fMRI SVM, ВЕ, KNN, CNN, DL 84.05%/-80%/84.1%/78% 
Thabtah et al.(2018) 707HR, 393LR “C&T&A” / AQ-10 RIPPER, C4.5 92%/90.7%/93%/- 
Thabtah(2019) 707HR, 393LR “C&T&A” / AQ-10 NB, LR 99.85%/99.9%/99.7%/- 
Thabtah et al.(2019) 248T, 1118A “TRA” 57.5:53.3 AQ-10 IG， 卡 方 检验 97.58%/97.6%/95.86%/- 
Thabtah et al.(2020) 292C,104T,704A ау29.2 岁 / AQ-10 RML, RIPPER, Bagging, CART, C4.5, Prism 90%/91%/92%/- 
Tariq et al.(2018) 116ASD,46TD av5 岁 ,av3 # 64.6 ADOS, ADI-R ADTree, SVM, LR, 线性 SVM 96.2%/100%/77.3%/94% 
Wan et al.(2019) 37ASD,37TD 4 一 6 岁 89.2;73 眼 动 数据 SVM 85.1%/86.5%/83.8%/- 
Wedyan et al.(2019) 15ASD,15TG 2 一 4 # 80;86.7 上 肢 运 动 LDA, SVM 93.8%/91%/98.1%/- 
Wingfield et al.(2020) 195ASD,33non av2 # 80;84.8 PAAS 核对 表 RF, Adaboost, DT, NN, NB -/96%/97%/98% 
Yang(2020) 908ASD “с? / 自 闭 症 面孔 图 片 CNN, SVM, DL 90%/96%/85%/93.8% 
TE: 评价 指标 参数 采用 重点 研究 或 最 佳 分 类 器 的 最 优 参数 (比较 顺序 为 Acc-, AUC, Sen-, Spe-); 国家 以 第 一 作者 所 在 国家 为 准 。 


поп: JË ASD; C(Children): 儿童 ; T(Teenager): 青少年 ; A(Adult): 成 人 ; av(Average): 平均 年 龄 ; TD/TC/TG/HC/NC/NT/NEU(typically developing/ tytical control / typically Growing 
/ healthy control / normal control / neurotypical/ neurotypical controls): 典型 发 展 儿童 ，MR(Medium-risk): 中 风险 ; SVC/SVR(Support Vector Classification/ Regression): 支持 向 量 分 类 / 
J; LSSVM(Least Squares SVM): 最 小 二 乘 支持 向 量 机 ; RML(Rules-Machine Learning): 规则 机 器 学 习 ; CART(Classification and Regression Tree): 分 类 回归 树 ; GLM(Generalized 
Linear Model): 广义 线性 模型 ，TwIST(Two-Step Iterative Shrinkage/Thresholding): 两 步 欠 代 收缩 ， PCA(Principal Component Analysis)): 主要 成 分 分 析 ; MSROM(multi scale ranked 
organizing maps): 多 比例 尺 排列 组 织 图 ，MSE(Multi scale entropy): #4 REI; FC-DNN(fully connected deep neural networks): 全 连接 的 深度 神经 网 络 ，SMOTE(Synthetic Minority 
Over-sampling Technique): 人 工 少 数 类 过 采样 ，NNeural network): 神经 网 络 ，BLSTM NN(bidirectional long short-term memory neural network): 双向 长 短 时 记忆 神经 网 络 ; 
IG(nformation Gain) : 信息 增益 :ARIA(Automatic retinal image analysis): 视网膜 图 像 自动 分 析 ; FRF(Functional Random Forest): 功能 随机 森林 ; GNB (Gaussian Naive Bayes): 
高 斯 朴素 贝 叶 斯 ， MGOA (Modified Grasshopper Optimization Algorithm): 改进 的 昨 里 优化 算法 ; MFCM(Multilayer Fuzzy Cognitive Maps): 多 层 模糊 认 知 地 图 ;，LSTM(Long Short- 
Term Memory): 长 短期 记忆 网 络 ; MISO-DNN(nulti-input single-output deep neural network): 多 输入 单 输出 深度 神经 网 络 ，PNN (probabilistic neural network): 概率 神经 网 络 ; 
PAAS(pictorial autism assessment schedule): 自 闭 症 图 片 评估 程序 
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